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摘 要 : 针对 在 移动 环境 下 使 用 传统 推荐 算法 进行 个 性 化 影视 推荐 时 存在 的 准确 度 不 高 的 问题 ， 提 出 了 一 种 基于 情 
境 感 知 的 算 阵 分 解 算 法 。 该 算法 在 基本 给 阵 分 解 算 法 的 基础 上 ， 通过 融入 全 局 偏 置 和 情境 偏 置 来 进行 行 未 知 评分 预测 。 
该 算法 的 优势 在 于 ， 一 方面 ， 使 用 和 王 阵 分 解 的 方式 使 得 托 阵 的 规模 远 远 小 于 原始 评分 矩阵 ; 另 一 方面 ， en 
融入 了 情境 要 素 对 评分 的 影响 ， 使 得 预测 评分 更 加 精准 。 通 过 在 LDOS-CoMoDa 数据 集 上 进行 实验 ， 结 果 表明 ， 
算法 在 准确 度 上 优 于 基于 用 户 的 协同 过 滤 算 法 、 基 本 矩阵 分 解 算 法 和 Baseline 预测 算法 。 
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Research on personalized film recommendation algorithm based on 
context-aware in mobile environment 
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Abstract: Aiming at the problem of low accuracy in the use of traditional recommendation algorithm in mobile 
environment, a matrix factorization algorithm based on context-aware was proposed. Based on the basic matrix factorization 
algorithm, the algorithm performed unknown score prediction by incorporating global bias and context bias. The advantage 
of this algorithm is that, on the one hand, the matrix factorization was used to make the scale of the matrix much smaller 


than the original scoring matrix; on the other hand, the algorithm fully integrated the influence of the situational elements on 
the score, making the prediction score more accurate. Experiments on the LDOS-CoMoDa dataset show that the proposed 
algorithm outperforms the user-based collaborative filtering algorithm, the basic matrix factorization algorithm and Baseline 


prediction algorithm. 
Key words: movie recommendation; matrix factorization; context-aware 


£ 0 引言 愿意 观看 贺岁 类 或 喜剧 类 的 影视 节目 。 如 果 像 以 往 的 个 性 化 
一 贡 推荐 一 样 ， 仅 仅 考 虑 用 户 和 被 推荐 的 影视 节目 两 个 维度 是 远 
移动 互联 网 时 代 的 到 来 以 及 智能 手机 和 平板 电脑 等 移动 远 不 够 的 ， 还 需要 充分 考虑 情境 因素 。 移 动 环 境 下 基于 情境 
终端 设备 的 普及 ， 使 得 越 来 越 多 的 用 户 使 用 移动 设备 体验 观 。 感知 的 个 性 化 影视 推荐 可 以 实时 地 为 用 户 推 荐 符合 用 户 当 前 
影 服务 。 据 《中 国电 影 观众 观 影 行为 调研 报告 2014 一 2015》 ”情境 的 影视 信息 ， 从 而 更 好 地 满足 用 户 的 个 性 化 观 影 需求 ， 
显示 ， 在 非 影院 观 影 渠道 中 ， 有 近 57.3% 的 用 户 使 用 移动 设 ”为 用 户 提供 更 精准 的 服务 所。 
备 观看 影视 节目 ， 可 见 移动 观 影 这 种 方式 受到 越 来 越 多 人 的 个 性 化 推荐 服务 与 情境 因素 相 融 合 受到 了 学 者 的 普遍 关 


注 。 针 对 不 同 的 应 用 领域 ， 涌 现 出 了 不 同 的 研究 成 果 。 在 移 
个 性 化 推荐 是 解决 此 类 问题 的 一 种 有 效 方法 。 它 根据 用 户 动 环 境 下 个 性 化 阅读 推荐 领域 ， 曾 子 明 等 人 中 通过 在 传统 的 
身 的 特点 和 需求 ， 将 有 价值 的 信息 主动 地 推荐 给 用 户口。 协同 过 滤 算 法 中 融入 了 情境 条 件 ， 提 出 了 一 种 基于 情境 感 
是 在 移动 环境 下 ， 个 性 化 推荐 具有 很 强 的 情境 敏感 性 ， 用 知 的 移动 阅读 个 性 化 信息 推荐 模型 ， 从 而 为 特定 环境 下 的 读 


青睐 。 与 此 同时 ， 移 动 互联 网 的 信息 过 载 问题 日 趋 严重 ， 


| 


情境 的 不 同 ， 使 得 用 户 的 需求 和 兴趣 也 有 所 不 同 ， 在 观 影 方 ” 者 提供 个 性 化 阅读 服务 ， 在 移动 电子 资源 推荐 领域 ， 田 雪 移 
看 尤为 突出 。 例 如 ， 了 冒险 精神 的 人 可 能 喜欢 警匪片 或 探 ”外 将 情境 因素 引入 到 个 性 化 推荐 系统 中 ， 提 出 了 基于 情境 和 
险 片 ， 男 性 比较 偏好 战争 片 和 动作 片 ， 而 女性 可 能 对 爱情 片 基于 内 容 相 结 合 的 推荐 算法 ， 利 用 用 户 的 历史 情境 信息 和 偏 
和 家 庭 片 更 感 兴趣 ， 当 用 户 在 重大 节日 ， 如 春节 时 ， 可 能 更 。 好 信息 为 特定 环境 下 的 用 户 提供 个 性 化 电子 资源 服务 ， 在 个 
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性 化 健康 服务 领域 ，Kim 等 人 D 在 协同 过 滤 过 程 中 利用 情境 ”的 部 分 情境 要 素 ， 将 移动 观 影 情 境 要 素 分 为 静态 信息 和 动态 
模型 来 提取 用 户 偏 好 缺失 值 ,将 情境 感知 与 协同 过 滤 相 结合 ， ” 信息。 其中， 静态 信息 是 指 用 户 长 期 累积 沉淀 的 不 易 发 生变 
应 用 于 个 性 化 健康 服务 系统 中 ; 在 移动 数字 图 书馆 资源 个 性 ”化 的 自身 特性 ， 包 括 年 龄 、 性 别 、 职 业 、 学 历 以 及 性 格 ; 动 
化 推荐 领域 ， 洪 亮 等 人 中 结 合 移动 数字 图 书馆 的 资源 布局 及  ” 态 信息 是 指 用 户 自身 或 周围 环境 动态 变化 的 特性 ,包括 时 间 、 
E 送 特征 ,设计 了 一 种 基于 情境 感知 的 个 性 化 资源 推荐 方式 ， 地点、 天 和气 、 日 期 、 伴 但、 心情 、 身 体 状况 、 观 后 情绪 、 观 
为 移动 数字 图 书馆 资源 推荐 提供 了 一 种 新 的 思路 。 影 决 定 以 及 观 影 次 数 。 初 步 拟 定 了 15 个 情境 要 素 ， 如 表 1 
综 上 所 述 ， 为 了 保证 移动 环境 下 个 性 化 推荐 的 质量 ， 需 。 所 示 。 
要 充分 考虑 情境 因素 。 然 而 上 述 学 者 的 研究 大 部 分 是 基于 邻 表 1 移动 观 影 情境 要 素 分 类 
域 的 协同 过 滤 推 荐 方法 ， 该 方法 主要 考虑 用 户 一 项 目 评分 算 Table 1 Classification of context elements in mobile movie watching 
会 
a 


阵 。 众 所 周知 ， 在 实际 场景 中 ， 用 户 一 项 目 评分 矩阵 可 能 年 龄 1-18 岁 、19-40 岁 、41-60 岁 、60 岁 以 上 
非常 稀 玖 ， 为 了 提取 更 有 用 的 信息 ， 本 文采 用 和 矩阵 分 解 的 移 坊 性 别 男 、 女 
式 来 进行 降 维 处 理 。 同 时 ， 基 于 邻 域 的 协同 过 滤 推荐 方法 更 车 上 了 业 学 生 、 教 师 、 商 人 等 
多 的 是 一 种 基于 统计 的 方法 ， 并 没有 学 习 的 过 程 。 而 矩阵 分 “学 所 小 学 、 初 中 、 高 中 、 本 科 等 
解 的 方法 具有 较 好 的 理论 基础 ,是 一 种 基于 机 器 学 习 的 方法 ， 性 格 朗 、 内 敛 、 稳 重 等 
它 通 过 优化 一 个 设 定 的 目标 函数 来 建立 最 优 的 模型 中 。 时 间 早上 、 下 午 、 晚 上 等 
为 此 ， 本 文 提出 了 基于 情境 感知 的 矩阵 分 解 也 点 在 家 、 公 司 、 朋 友 家 等 
CAMF(context-aware matrix factorizatiom) 算 法 , 主要 针对 个 性 赤 气 晴天 、 阴 天 、 雨 天 、 雪 天 、 大 风 等 
化 影视 领域 中 的 情境 感知 进行 探讨 。 相 比 于 基于 用 户 的 协同 入境 期 工作 日 、 周 末 、 节 假日 
过 滤 算 法 和 基本 矩阵 分 解 算 法 ， 具 备 了 情境 感知 的 能 力 ， 从 二 PE 倡 己 、 家 人 、 朋 友 等 
而 为 用 户 提 供 符合 当前 情境 的 影视 信息 。 本 文 详细 介绍 了 心情 心 、 平 静 、 悲 伤 等 
CAMEF 算法 , 并 采用 LDOS-CoMoDa 数据 集 与 基于 用 户 的 协 动态 身体 社 鞍 ， 赴 病 
同 过 滤 算 法 、 基 本 和 矩阵 分 解 算法 和 Baseline 预测 算法 进行 实 信息 状况 
验 对 比分 析 ， 结 果 显 示 CAMF 算法 具有 更 高 的 准确 性 。 观 后 韭 伤 Nee 
Cs 、 “三 所 于 
1 ”相关 工作 
a 己 选 择 、 别 人 推荐 
1.1 情境 和 情境 感知 决定 ee 
关于 情境 ， 目 前 比较 公认 和 广泛 使 用 的 定义 是 Dey[g 提 观 影 _ 
十] 立 卓 导 Ms 术 全 人 7 是 宇 自 妇 和 人 字 iS i 第 一 次 、 大 于 一 次 
出 的 : 情境 是 描述 实体 在 某 个 场景 中 的 信息 组 合 ， 实 体 可 以 次 数 


是 用 户 也 可 以 是 与 应 用 程序 交互 相关 联 的 对 象 。 本 文 认为 移 
动 环 境 下 用 户 的 观 影 情境 是 指 影 响 用 户 当前 观 影 需求 的 信息 ”1.3 基于 用 户 的 协同 过 滤 算法 
合 ， 包 括 时 间 人 信息、 地 理 位 置信 息 、 天 气 信 息 等 。 基于 用 户 的 协同 过 滤 算 法 是 应 用 最 广泛 最 成 功 的 协同 过 
情境 感知 的 概念 最 早 由 Schilit 等 人 中 于 1994 年 提出 ,他  ” 滤 推 荐 算法 中 的 一 种 。 它 的 主要 思想 是 通过 用 户 对 项 目的 评 
认为 情境 感知 是 指 软件 能 够 根据 当前 所 在 的 情境 来 调整 自身 ”分 来 获得 相似 用 户 ， 然 后 根据 相似 用 户 可 能 具有 相似 的 兴趣 
态 。 目 前 人 们 普遍 接受 的 是 Dey00 对 于 情境 感知 的 定义 ， 偏好 来 进行 推荐 。 因 此 ， 基 于 用 户 的 协同 过 滤 算 法 主要 分 为 


他 认为 情境 感知 是 指 利用 情境 信息 为 用 户 提供 相关 信息 或 服 ”两 步 : a) 根 据 用 户 对 项 目的 评分 计算 用 户 之 间 的 相似 度 ， 相 

务 的 过 程 。 在 移动 环境 下 针对 用 户 观 影 的 情境 感知 就 是 根据 “，” 似 度 的 度量 方法 有 很 多 种 ， 包 括 余弦 相似 度 和 皮尔 逊 相关 系 

用 户 当前 的 情境 信息 来 为 用 户 提供 更 好 的 观 影 信 息 和 服务 。 数 等 ， 本 文采 用 的 是 皮尔 逊 相关 系数 ，b) 根 据 第 一 步 计算 的 

1.2 情境 要 素 用 户 相似 度 为 当前 用 户 寻找 最 近邻 ， 并 根据 最 近邻 预测 当前 
针对 不 同 的 应 用 领域 或 者 系统 ， 考 虑 的 情境 要 素 也 有 所 ”用户 对 未 评分 项 目的 评分 ， 然 后 根据 预测 评分 向 用 户 进行 推 

不 同 。 比 如 ， 在 移动 电子 资源 推荐 系统 中 ， 情 境 要 素 主要 考 。 荐 。 

虚设 备 信息 、 位 置信 息 、 网 络 状 况 、 时 间 信 息 和 用 户 偏好 轧 ; 1.4 基本 矩阵 分 解 算法 


在 自 适 应 学 习 系统 中 ， 人 情境 要 素 主要 考虑 物理 情境 、 用 户 情 基本 矩阵 分 解 的 基本 思想 是 将 用 户 -项 目 评分 矩阵 R 分 
境 和 学 习 情境 1， 在 搜索 引擎 系统 中 ,情境 要 素 主 要 考虑 搜 。 解 为 两 个 低 维 的 用 户 潜在 特征 矩阵 P 和 项 目 潜 在 特征 矩阵 Q， 
索 意 图 、 地 理 位 置 、 时 间 和 设备 信息 等 。 使 得 P 和 Q 的 乘积 近似 拟 合 RYH， 即 

针对 影视 领域 进行 个 性 化 推荐 时 ， 李 晟 0 按照 情境 信息 ar 
的 状态 维度 ， 把 用 户 观 影 情 境 分 为 静态 情境 和 动态 情境 。 其 Re ee (1) 
中 ， 静 态 情 境 包 括 年 龄 、 性 别 、 职 业 、 性 格 等 ， 动 态 情 境 包 Er 


括 时 间 、 地 上 点、 天气、 心情 、 伴 倡 等 。 qh 

Kosir 等 人 (为 了 探究 个 性 化 推荐 与 情境 的 关系 时 ， 建 其 中 : RW eR Wn 表示 用 户 一 项 目 评分 矩阵 ; Ps 4 表 
立 了 一 个 包含 情境 要 素 的 有 关 影 视 方面 的 数据 集 示 用 户 的 潜在 特征 矩阵 ; Q_sR "表示 项 目的 潜在 特征 矩阵 ; 
LDOS-CoMoDa， 该 数据 集 包含 了 time (时 间 )、daytype (日 。“p, 表 示 用 户 u 的 潜在 特征 向 量 ;4 表示 项 目 i 的 潜在 特征 向 
期 )、season (季节 )、location (地 点 )、weather (天 气 )、 social ” 量 ; d < min(m,n) 表 示 特 征 向 量 维度 。 使 用 p, 和 g; 的 内 积 来 


(伴侣 )、endEmo ( 观 影 后 情绪 )、mood (心情 )、dominantEmo 预测 用 户 u 对 项 目 i 的 评分 ， 即 
(主要 情绪 )、physical (身体 状况 )、decision( 观 影 决 定 ) fi =47 Pp @Q) 
和 interaction 〈 观 影 次 数 ) 共 12 个 情境 要 素 。 为 了 找到 式 (2) 中 的 特征 向 量 p,、g;， 和 矩阵 分 解 算法 
本 文 借鉴 李 晟 的 思想 ， 同 时 融合 LDOS-CoMoDa 数据 自 需要 定义 一 个 目标 函数 以 求 得 最 小 平方 差 ， 即 


uy 
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. 1 2 1 
min 二 (7 一 27 十 二 入 (G2 十 p,? 
min 2 a Wp,) TAX + pe) (3) 


其 中 :KK 为 已 有 评分 记录 的 〈u，i) 对 集合 ; 为 用 户 u 对 
项 目 i 的 真实 评分 ,X(q?+ pw 为 防止 过 拟 合 的 正则 化 项 ; 和 为 
正则 化 系数 。 为 了 获得 上 述 目标 函数 的 最 优 解 ， 可 以 应 用 随 
机 梯度 下 降 (stochastic gradient descent,SGD ) 法 05] 来 进行 求 
解 。 
1.5 Baseline 预测 算法 

Baseline 预测 算法 认为 用 户 对 项 
目 本 身 特 性 的 影响 494， 比 如， 对 于 随意 的 用 户 来 说 ， 他 的 评 
分 普遍 高 于 平均 评分 ， 而 对 于 严格 的 用 户 来 说 ， 他 的 评分 普 
遍 较 低 。 同 理 ， 对 于 项 目 来 说 ， 以 影视 项 目 为 例 ， 质 量 高 的 
影视 项 目 评分 普遍 较 高 ,而 质量 差 的 影视 项 目 评分 普遍 较 低 。 


的 评分 受到 用 户 或 项 
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设 userl 对 moviel 的 喜好 程度 q7p, 为 2.5 分 , moviel 的 口碑 比 
其 他 影视 节目 低 0.5 分 , 即 5b=-0.5; 另 一 方面 userl 是 个 打分 
比较 随意 的 用 户 ， 一 般 偏 向 于 给 影视 节目 打 高 0.3 分 ， 即 
b=0.3 ， 同 时 ，userl 在 当前 情境 下 对 该 类 影视 节目 的 评分 偶 
向 于 打 高 0.2 分 , 即 b.=0.2 ,那么 userl 对 moviel 的 预测 打分 
为 2.5-0.5+0.3+0.2=2.5 分 。 

2.2 训练 模型 

评分 预测 模型 的 目标 是 使 预测 评分 尽 可 能 接近 真实 值 。 
为 了 训练 模型 ， 设 定 如 下 目标 函数 : 


1 大 
L=min > =(% -gp, -bb,— 2b(). )+ 
2 2 (ND), 


| 有， (9) 
Barto th rot), | 
j=l 


本 文 将 这 些 独 立 于 用 户 或 项 目的 影响 因素 称 为 全 局 偏 置 
Baseline 融入 全 局 偏 置 的 评分 预测 模型 为 
hi =H+ b+ bh (4) 
中 :; 表示 用 户 b 对 项 目 i 的 预测 评分 表示 训练 集 的 
局 平均 值 ，b, 表示 用 户 u 的 偏 置 项 ， 即 独立 于 用 户 本 身 的 
向 ; 4b; 表示 项 目 i 的 偏 置 项 ， 即 独立 于 项 目 本 里 的 影响 。 
为 了 求解 h 和 4&b， 同 样 采用 设 定 一 个 目标 函数 L， 利 用 
随机 梯度 下 降 法 05 求 解 最 优 值 。L 为 


1 1 
L=min ~—(ti— Wb—b) +omA(b? +b,? 
a Hb) + 1b +b) (5) 


i 


处 央 冰 


2 CAMF 算法 


2.1 评分 预测 模型 
基本 和 矩阵 分 解 算法 通过 学 习 用 户 和 项 目的 洪 在 特征 向 量 
进行 预测 。 其 中 ， 项 目的 潜在 特征 向 量 代表 了 项 目的 每 个 特 
性 的 程度 ， 用 户 的 潜在 特征 向 量 代表 了 用 户 对 项 目 每 个 特性 
的 喜好 程度 , 两 个 向 量 的 内 积 表示 用 户 对 该 项 目的 喜好 程度 。 
上 节 Baseline 预测 算法 可 知 ， 用 户 的 评分 易 受 到 用 户 
或 项 目 本 身 特性 这 些 全 局 偏 置 的 影响 ， 因 此 ， 本 文 首先 在 用 
户 对 项 目的 喜好 程度 ( 即 基 本 和 矩阵 分 解 算法 ) 的 基础 上 融入 全 
局 偏 置 ， 记 为 b 。 


b, =b,+ bb (6) 
其 中 :参数 b, 和 4 的 含义 与 Baseline 预测 算法 中 的 一 致 。 
然而 在 实际 生活 中 ， 尤 其 是 移动 环境 下 ， 用 户 的 评分 具 
有 一 定 的 情境 敏感 性 。 比 如 ， 用 户 的 心情 和 观 影 后 的 体验 会 
影响 用 户 对 影视 节目 的 评分 。 为 了 融入 情境 要 素 对 评分 的 影 
响 ，Baltrunas 等 人 07 在 其 提出 的 CAMF-CC 评分 预测 模型 中 
设 定 每 个 情境 要 素 对 同一 类 别 的 项 目 评分 具有 相同 的 影响 。 
本 文 借鉴 Baltrunas 的 思想 , 将 情境 要 素 对 某 一 类 别 的 
项 目的 影响 称 为 情境 偏 置 ， 记 为 b. 。 并 继续 将 其 融入 到 基本 
和 矩阵 分 解 算 法 中 。 


b. -2 O) 


中 : t 为 项 目 所 属 类 别 ，ci 为 情境 要 素 ， 共 包含 k 个 ，b(D。 


并 


其 中 : 5 为 训练 集中 的 实际 评分 ; K 为 已 有 评分 记录 的 (1， 
i) 对 集合 ， 四 + ps +b? rho ] 为 正则 化 项 入 为 了 


则 化 系数 ， 通 过 调整 4 可 以 防止 训练 集 数 据 过 度 拟 合 。 其 
参数 的 含义 与 基本 算 阵 分 解 算法 和 上 节 评 分 预测 模型 中 的 多 
数 一 致 。 

为 了 优化 目标 函数 工 ， 可 以 利用 随机 梯度 下 降 法 55 进行 
优化 训练 。 对 于 训练 集 的 每 一 个 评分 i ， 按 照 目标 函数 工 的 


负 梯 度 方 向 ， 不 断 和 迭代 优化 参数 % , 忆 沁 ,六 ，b(0s ， 最 终 取 


得 最 优 解 。 计 算 公 式 如 下 所 示 ， 其 中 : 式 (10) 为 误差 公式 ， 
式 (11) ~ (15) 为 负 梯 度 方向 计算 公式 (通过 求 偏 导数 的 
方式 )， 式 (16) ~ (20) 为 参数 迭代 更 新 公式 。 


本 


内 舍 


k 
ea = ha = ps-b-b,— 2b(t), (10) 
j=1 
oaL 
a P49 (11) 
oaL 
= 
a (2) 
oL 
-天 -加 (13) 
oaL 
-下 -加 (14) 
aL 
=es -hb 
6b(D。 oh 
oL 
qi= 4g + - 世 ]- = 和 +y(euP —44;) (16) 
gq; 
pu =P, + -于 上 - put Y(euq;—Ap,) (17) 
b=b, (和) +Y(eu — 4b;) (18) 
Ob; 
aL 
b, =b, + -多 |- =b, + Y(ea -4b,) (19) 


b(t), =b(t). 十 | =b(t), +?zy(e -4b(t),) (20) 


ee y ee cb(t)。 
表示 情境 要 素 cj 对 t 类别 影视 项 目的 影响 。 
融入 全 局 偏 置 和 情境 偏 置 的 CAMF 评分 预测 模型 如 下 : 其 中 : y 为 学 习 率 也 是 梯度 下 降 的 步 长 ， 通 过 实验 不 断 优化 
、 k 调整 。 
Fi =497 ps +ba tb =q7p, +b,+b, + b(t). Y 
Wi 0 (6) 。 2.3 算法 流程 及 流程 图 
biao 表示 用 户 在 情境 要 素 cl,c2,…,ck 下 对 影视 项 目 i 的 预 本 节 给 出 CAMEF 算法 计算 目标 用 户 u 对 项 目 i 的 评分 预 


测评 分 。 


例如 ， 要 预测 用 户 userl 对 影视 节 


moviel 的 评分 ， 假 


测 函 数 的 流程 及 流程 图 。 
输入 :用户 一 项 目 评分 和 矩阵 R, 学 习 率 y, 正则 化 系数 和 ， 
和 迭代 次 数 na 和 特征 向 量 维度 d。 
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开始 : 


a) 将 数据 分 为 训练 和 
设置 相关 参数 的 初始 值 。 用 


oe 1 
在 特征 矩阵 Q 用 和 本 成 了 


t 类 别 项 目下 的 bp(b。 初始 


contextValueNum( 情 境 变 量 c 的 取 值 个 数 ) 维 向 量 。 


初始 成 全 0 的 向 量 ， 


b) 迭 代 。 


对 于 训练 集中 的 每 组 


罗 国 前 


1 ， 等 : 移动 环境 下 基于 情 


lt 


评分 记录 : 


测试 集 ， 验 证 集 。 
户 潜 在 特征 矩阵 了 和 项 


E 比 的 随机 数 进行 填充 , bh 和 4b, 


潜 


全 0 的 


(a) 根据 式 (11) ~ (15) 计 算 负 梯度 下 降 方向 ， 


(b) 根据 式 (16) ~ (20 
计算 验证 集 平均 绝对 


敛 或 达到 友 代 次 数 n。 
输出 : 目标 用 
结束 。 

其 流程 如 图 


户 u 对 


1 所 示 。 


) 更 新 参数 。 
[误差 MAE( 衣 


见 3.2), 直到 MAE 收 


项 


d 


算 负 


Fig. 1 


基于 用 


On2)。 
向 量 维度 为 f 迭代 
Baseline 预测 算法 ， 


法 » 
OUks(fHc)ss)。 


种 算法 。 


划分 数据 ( 训 
集 ,验证 集 ) 


lj 试 


训练 集 每 条 记录 计 
梯度 下 降 方 向 


| 受 口 


| 


户 的 协同 过 滤 算 法 的 时 间 玫 
中 ， 若 用 户 的 数量 为 n， 项 
对 于 基本 算 阵 分 解 算 法 ， 如 果 
s 次 ， 则 时 间 复 杂 


上 可 知 ，CAMEF 算法 和 基本 外 
上 相差 不 大 ，Baseline 预测 算法 的 时 间 复 杂 度 小 于 以 上 两 


而 如 果 VsG+os >n， 则 CAMF 算法 的 时 间 复 杂 度 


三 集 MAE 收 敛 或 i 
到 和 迭 代 次 数 n 


CAMF 算法 流程 
Flow chart of CAMF algorithm 
2.4 时 间 复 杂 度 分 析 


如 果 考 虑 的 情境 要 素 为 个 ， 


法 的 时 


复杂 度 上 没 


间 复 条 度 要 稍微 高 于 基于 / 
和 矩 阵 分 解 算 法 需要 多 次 迭代 。 但 总 体 上 上 ， 这 
9 质 的 差别 [7。 


目 i 的 评分 预测 函数 参数 。 


答 出 评分 预测 函数 
参数 


F 销 主要 在 相似 度 计 算 
目的 数量 为 m， 则 时 间 复 杂 度 为 
可 k 条 评分 记录 ， 特 征 
度 为 O(k*f*s)。 对 于 
时 间 复 杂 度 为 O(k*s)。 而 对 于 CAMF 算 


Tl 


则 时 间 复 杂 度 为 


E 阵 分 解 算法 在 时 间 复 杂 


高 于 基于 用 户 的 协同 过 滤 算 法 。 在 一 般 情 况 下 ， 甜 阵 分 解 算 


户 的 协同 过 滤 算 法 ， 因 为 


种 算法 在 时 间 


3 ”实验 与 分 析 


本 章 主 要 针对 本 文 提 日 


同 过 滤 算 法 、 


ChinaXiv 合 作 期 刊 


境 感知 的 个 性 化 影视 推荐 算法 研究 


绍 实 
并 对 结果 进行 对 比分 析 。 
3.1 数据 集 及 实验 环境 


个 


LDOS-CoMoDa 是 
包含 丰富 的 情境 要 素 的 


泛 使 用 。 因 此 ， 本 文选 


了 121 个 用 


取 值 是 


户 对 1 232 部 


电影 评分 数据 集 ， | 
点 ， 从 而 被 研究 情境 感知 的 学 者 广 
该 数据 集 进行 实验 。 该 数据 集 包含 
BE 影 的 2 296 条 评分 记录 ， 评 分 的 
1 一 5。 该 数据 集 的 详细 参数 如 表 2 所 示 。 


的 CAMF 算法 与 基于 
基本 和 矩阵 分 解 算法 和 Baseline 预测 算法 i 
验 对 比分 析 ， 以 验证 该 算法 的 


LDOS-CoMoDa 数 据 集 


tk 包含 30 个 变量 , 其 中 ， 
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j 户 的 协 
行 实 


I 效 性 。 接 下 来 ， 本 文 首先 介 
仿 用 到 的 数据 集 、 实 验 环 境 和 评估 方法 ， 然 后 设计 实验 


已 开源 和 


time、daytype、 


location、 weather、 social、 mood、 endEmo、 physical、 decision 


和 interaction 属于 情境 要 素 品 


境 要 素 中 的 静态 信息 。 


P 的 动态 信息 ; age 和 sex 属于 情 
因此 ， 实 验 考 虑 以 上 12 个 情境 要 素 。 


这 些 要 素 的 取 值 都 为 正 整 数 ， 如 果 缺 失 的 话 ， 它 的 值 被 设置 


为 -1。 为 了 处 理 方便 ， 实 验 对 数据 做 以 
年 龄 值 划分 为 1~18 岁 、19~40 岁 、41~60 岁 和 60 岁 以 上 


处 至 


FE : a) 将 具 


体 的 


段 ; b) 将 年 龄 缺失 值 用 均值 进行 填充 ， 


要 素 的 描述 如 表 3 所 示 。 


其 他 要 素 缺 失 值 用 


游 儿 了 辐 


要 素 取 值 的 众 数 〈 出 现 频率 最 高 的 值 ) 进行 填充 。 以 上 情 


实验 环境 为 Windows 10 操作 系统 ，8 GB 内 存 ，Inte!®) 


Core(M 17-3770 CPU 3.40 GHz， 实 验 程 序 使 用 


开发 。 


表 2 LDOS-C 


oMoDa 


Python3 语言 


电影 评分 数据 集 描述 
Table 2 Description of LDOS-comoda movie sc 


ore data set 


评分 范围 评分 总 数 户 数 ”项目 数 变量 总 数 用 户 属性 ”稀疏 度 
[1~5] 2296 121 1232 30 4 98.45% 
* 稀 朴 度 : 评分 矩阵 中 未 评分 数 与 总 数 的 比值 
表 3 情境 要 素描 述 
Table 3 ”Description of context elements 
情境 变量 取 值 [下 
time Morning(1),Afternoon(2),Evening(3),Night(4) 寸 间 
daytype Working day(1),Weekend(2),Holiday(3) 期 
locatin Home(1), Public place(2), Friend's house(3) 也 点 
ee Sunny/clear(1),Rainy(2),Stormy(3), 天 气 
Snowy(4), Cloudy(5) 
Alone(1),My partner(2), Friends(3), 
social Colleagues(4), Parents(5), Public(6), 伴侣 
My family(7) 
mood Positive(1), Neutral(2), Negative(3) 心情 
rn Sad(1), Happy(2), Scared(3), Surprised(4), 观 后 情绪 
Angry(5), Disgusted(6), Neutral(7) 
physical Healthy(1),111(2) 身体 状况 
decision User’s choice(1), Given by other(2) 观 影 决定 
interaction First(1),n-th(2) 观 影 次 数 
age 1-18(1), 19-40(2), 41-60(3),60 以 上 (4) 年 龄 
sex Male(1), Female(2) 性 别 
3.2 评估 方法 
实验 采用 平均 绝对 偏差 MAE (mean absolute error ) 作为 
推荐 算法 准确 度 的 评估 方法 .MAE 通过 计算 用 户 的 预测 评分 
和 实际 评分 的 偏差 来 衡量 算法 的 准确 性 , MAE 值 越 小 , 准确 
度 越 高 ， 推 荐 质量 越 高 。MAE 的 计算 公式 为 
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有 


评分 。 
3.3 ”实验 结 


N 
MAB= ul -| 
N 
: N 为 测试 集 大 小 ; 


吉 果 与 分 析 
为 了 使 测试 结果 更 加 精确 ， 本 文采 用 


法 来 进行 实验 。 
LDOS-CoMoDa 数据 集 分 为 10 份 , 轮流 将 其 中 1 份 作为 测试 
集 , 9 份 作 为 训练 集 进 行 实验 。 而 在 进行 基本 矩阵 分 解 算法 、 
Baseline 预测 算法 和 CAMF 算法 实 
份 ， 轮流 将 其 中 1 份 作 为 测试 集 ，1 


在 进行 基于 月 


为 用 户 预 测评 分 ; 


罗 国 前 ， 


CD 
j 户 实际 


Ri 为 | 


上 折 交 叉 验 证 的 方 


户 的 协同 过 滤 算法 实验 时 ， 将 


仿 时 ， 将 数据 集 分 为 10 
份 作为 验证 集 ，8 份 作为 


训练 集 进行 实验 ， 最 后 取 10 次 结果 的 均值 作为 最 终结 果 。 
3.3.1 基于 用 户 的 协同 过 滤 算 法 实验 


实验 中 设 定 近邻 数量 


最 优 。 
0.98 
0.975 
0.97 
0.965 
0.96 
0.955 
995 


七 


小 


尹 


图 2 


基于 


k 的 取 值 为 [5，50]， 采 用 区 间 渐 进 
的 方法 ， 间 隔 为 5， 通 过 调整 k 值 来 观察 实验 结果 ， 如 图 2 
所 示 。 可 以 看 出 ，MAE 均值 在 0.96 一 0.98 间 波 动 ， 当 k=30 
时 ，MAE 均值 取得 最 小 值 ， 为 0.959 818， 此 时 推荐 的 效果 


DS NSN 


”> 


YYvVYUVYVYVYY 
户 的 协 


同 过 滤 方 法 MAE 均值 


Fig.2 User-based collaborative filtering method MAE mean 
3.3.2 基本 和 矩阵 分 解 算法 实验 


实验 中 设 定 预测 函数 中 和 
值 同 为 [0.01, 0.05], 同样 采用 
通过 调整 入 和 Y 来 获得 不 同 的 实验 结果 ,设置 迭代 次 数 为 100 


的 正则 化 系数 入 和 学 习 率 Y 的 取 


一 


2.06 
2.04 
2.02 
2 
1.98 
1.96 
1.94 
1.92 
1.9 


次 ， 特征 向 量 维 


MAE 均值 在 1.94 一 2.04 间 》 
习 率 y= 0.01 时 ，MAE 均值 取得 
推荐 的 效果 最 优 。 


区 间 渐 进 的 方法 , 间隔 为 0.01， 


度 为 10， 实 验 结果 如 图 3 所 示 。 可 以 看 出 ， 


Y=0.01y=0.02 


动 ， 当 正则 化 系数 =0.03 且 学 
最 小 值 ， 为 1.950 12， 此 时 


Y=0.03y=0.04y=0.05 


=—=@=—=N\ = 0.01 =—=@==\ = 0.02——@=—=N\ = 0.03 


=@==\ = 0.04—=@==\ = 0.05 


图 3 


基本 算 阵 分 解 


法 不 同 Y， 入 实验 结 


Fig. 3 Experimental results of different basic matrix factorization 


实验 参数 设置 与 基本 矩阵 分 解 算 法 实验 一 


algorithms for y and 入 
3.3.3 Baseline 预测 算法 实验 


致 ， 实 验 结果 


等 : 移动 环境 下 基于 情境 感知 的 个 性 人 
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如 图 4 所 示 。 可 以 看 出 ，MAE 均值 在 0.8~0.84 间 波 动 ， 当 
正则 化 系数 入 = 0.03 且 学 习 率 Y= 0.04 时 ，MAE 均值 取得 最 
小 值 ， 为 0.806 097， 此 时 推荐 的 效果 最 优 。 


0.85 


T 


0.84 
0.83 
0.82 
0.81 

0.8 
0.79 


0.78 
y=0.01y =0.02y=0.03y =0.04y=0.05 


—@—N\ -0.01——@—\ = 0.02 一 @ 一 和 人 = 0.03 
一 8 一 人 -= 0.04 一 9 一 入 = 0.05 
图 4 Baseline 预测 算法 不 同 Y， 和 实验 结果 


Fig. 4 Experimental results of different Baseline prediction algorithms 


fory and 入 

3.3.4 CAMEF 算法 实验 
3.3.5 结果 对 比分 析 
通过 以 上 实验 ， 得 到 了 基于 用 户 的 协同 过 滤 算 法 、 基 本 
矩阵 分 解 算法 、Baseline 预测 算法 和 CAMF 算法 的 运行 结果 ， 
现 将 以 上 实验 的 最 优 值 和 平均 信 汇 总 到 图 6 中 。 可 以 看 出 ， 
在 最 优 值 方面 ,基于 用 户 的 协同 过 滤 算 法 在 最 近邻 k= 30 时 ， 
取得 最 优 MAE 均 值 0.959 818， 基 本 和 矩阵 分 解 算 法 在 正则 化 
系数 入 = 0.03 目 0.01 时 ， 取 得 最 优 MAE 均值 
1.950 12，Baseline 预测 算法 在 入 = 0.03 且 Y = 0.04 时 ， 
最 优 MAE 均值 0.806 097， 而 CAMF 算法 在 入 = 0.04 上 日 

0.01 时 ， 取 得 最 优 MAE 均值 0.746 469， 相 比 以 上 三 种 算法 
最 优 MAE 均值 分 别 下 降 了 近 22.22%、61.72% 和 7.4%; 在 平 
均值 方面 ， 基 于 用 户 的 协同 过 滤 算 法 平均 MAE 均值 为 
0.964 228， 基 本 矩阵 分 解 算法 平均 MAE 均值 为 1.967 378， 
Baseline 预测 算法 平均 MAE 均值 为 0.816 832， 而 CAMF 算 
法 平均 MAE 均值 为 0.773 913, 相 比 以 上 三 种 算法 平均 MAE 
均值 分 别 下 降 了 近 19.74%、60.66% 和 5.25%。 说明 该 算法 具 


Do 


学 习 率 Y 


有 更 高 的 准确 性 ， 推 荐 的 效果 更 优 。 
2.5 
2 
1.5 
1 
0 
平均 值 
量 基 于 用 户 的 协同 过 滤 
国 基 本 和 拖 阵 分 解 算 法 
是 Baseline 预 测算 法 
加 CAMF 算 法 


图 6 MAE 均值 对 比 
Fig.6 MAE mean comparison 


4 ”结束 语 


本 文 提出 了 一 种 基于 情境 感知 的 矩阵 分 解 CAMEF 算法 ， 
通过 在 基本 矩阵 分 解 算法 的 基础 上 融入 全 局 偏 置 和 情境 偏 置 
来 改善 在 移动 环境 下 使 用 传统 推荐 算法 进行 个 性 化 影视 推荐 


录用 定稿 


时 
方 


分 


均 分 别 降低 了 近 19.7%、60.7% 和 5. 


罗 国 前 ， 等 : 移动 环境 下 基于 情境 / 


存在 的 准确 度 不 高 的 问题 。 该 算法 一 方面 通过 和 矩阵 分 解 的 
式 降低 了 评分 矩阵 的 维度 ， 另 方面 充分 融入 了 情境 要 素 
户 评 分 的 影响 ， 使 得 预测 评分 更 加 精准 ， 推 荐 的 效果 更 
。 最 后 ， 通 过 实验 与 基于 用 户 的 协同 过 滤 算 法 、 基 本 和 矩阵 
解 算法 和 Baseline 预测 算法 进行 比较 ， 该 算法 的 MAE 值 
3%， 从 而 验证 了 该 算 


法 的 有 效 性 。 本 文 的 研究 不 足 之 处 在 于 赋予 所 有 的 情境 要 素 
相同 的 权重 ， 忽 略 了 不 同 的 情境 要 素 对 于 推荐 结果 影响 力 的 
不 同 ， 在 后 续 研 究 中 进一步 解决 该 问题 。 


参考 文献 : 


[1] 


[2] 


[3] 


[4] 


[5] 


[6] 


洪亮 , 冉 从 茹 ， 吴 志 强 . 移动 环境 下 基于 共同 兴趣 的 情境 感知 信息 
推荐 研究 [加 . 情报 理论 与 实践 , 2014, 37 (11): 124-128. (Hong Liang, 
Zhai Congjing, Wu Zhiqiang. Research on situational perception 
information recommendation based on common interest in mobile 


environment [J]. Information Theory & Practice, 2014, 37 (11): 


124-128. ) 
郭 顺 利 ， 李 秀 霞 . 基于 情境 感知 的 移动 图 书馆 用 户 信 息 需 求 模型 构 
建 [J]. 情报 理论 与 实践 , 2014, 37 (8): 64-68. (Guo Shunli, Li Xiuxia. 


Construction of user information demand model for mobile library 
based on context awareness [J]. Information Theory & Practice, 2014, 
37 (8): 64-68. ) 
曾子 明 , 陈 贝 贝 . 移动 环境 下 基于 情境 感知 的 个 性 化 阅读 推荐 研究 
四. 情报 理论 与 实践 ，2015，38 (12): 31-36. (Zeng Ziming, Chen 
Beibei. Research on personalized reading recommendation based on 
situational perception in mobile environment [J]. Information Theory & 
Practice, 2015, 38 (12): 31-36. ) 

田 雪 多 于 情境 感知 的 移动 电子 资源 推荐 技术 研究 []J]. 
仓 机 实践 ，2015,，38 (5): 86-89. (Tian Xuewei. 


recommendation technology of mobile electronic resources based on 


情报 理 


Research on 


context awareness [J]. Information Theory & Practice, 2015, 38 (5): 
86-89. ) 

Kim J Lee D, Chung K Y. Item recommendation based on 
context-aware model for personalized u-healthcare service [J]. 
Multimedia Tools & Applications, 2014, 71 (2): 855-872. 

洪亮 , 钱 晨 ,村 星 . 移动 数字 图 书馆 资源 的 情境 感知 个 性 化 推荐 方 
法 研究 [中 . 现代 图 书 情报 技术 , 2016, 32 (7): 110-119. (Hong Liang, 
Qian Chen, 


personalization recommendation method of mobile digital library 


Fan Xing. Research on situational perception 


resources [J]. Modern Library and Information Technology, 2016, 32 


ChinaXiv 合 作 期 刊 
第 37 卷 第 5 期 


感知 的 个 性 化 影视 推荐 算法 研究 


(7): 110-119.) 
项 亮 , 推荐 系统 实践 [M]. 北京 : 人 民 邮 电 出 版 社 , 2012. (Xiang 


Liang. Recommended system practice [M]. Beijing:People's Posts and 


[7] 


Telecommunications Press, 2012. ) 
[8] Dey A K. Providing architectural support for building context-aware 
applications [J]. Phd Thesis Georgia Institute of Technology, 2000, 25 
(2): 106-111. 
[9] Schilit B, Adams N, Want R. Context-aware computing applications 
[CI]/ Proc of Workshop on Mobile Computing Systems & Applications. 
1994: 85-90. 
[10] Dey A K. Understanding and using context personal and ubiquitous 
computing journal [J]. Personal & Ubiquitous Computing, 2001, 5 (1): 
4-7. 
蒋 艳 荣 , 李 卫 华 ， 杨 劲 涛 . 上 下 文 感知 驱动 的 自 适 
交互 [J]， 智 角 


[11] 个 性 化 学 习 及 
系统 学 报 , 2014 (1): 60-68. (Jiang Yanrong, Li Weihua, 
Yang Jintao. Context-aware-driven adaptive personalized learning and 
interaction [J]. Journal of Intelligent Systems, 2014 (1): 60-68. ) 

李 居 . 基于 情境 感知 的 个 性 化 电影 推荐 [D]. 北京 : 北京 邮电 大 学 ， 


2012. (Li Wei. Personalized film recommendation based on context 


[12] 


perception [D]. Beijing Beijing University of Posts and 
Telecommunications, 2012. ) 
[13] Kosir A, Odi¢é A, Kunaver M, et al. Database for contextual 
personalization [J]. Elektrotehniski Vestnik/Electrotechnical Review, 
2011, 78 (5): 270-274. 
余 永 红 , 高 阳 , 王 纤 ,等 . 融合 用 户 社会 地 位 和 算 阵 分 解 的 推荐 算法 
四 . 计算 机 研究 与 发 展 , 2018, 55 (1): 113-124. (Yu Yonghong, Gao 


Yang, Wang Wei, et al. Recommendation algorithm for integrating user 


[14] 余 


social status and matrix decomposition [J]. Journal of Computer 
Research and Development, 2018, 55 (1): 113-124. ) 

[15] Salakhutdinov R, Mnih A. Bayesian probabilistic matrix factorization 
using Markov chain Monte Carlo [C]// Proc of International Conference 
on Machine Learning.[S.L] :ACM Press, 2008: 880-887. 

[16] 王建 芳 , 张 朋 飞 ， 刘 永利 . 基于 改进 带 偏 置 概率 答 阵 分 解 算法 的 研 
完 [加 . 计算 机 应 用 研究 , 2017, 34 (5): 1397-1400. (Wang Jianfang, 
Zhang Pengfei, Liu Yongli. Research on decomposition algorithm based 
on improved band offset probability matrix [J]. Journal of Computer 
Applications, 2017, 34 (5): 1397-1400. ) 

[17] Baltrunas L, Ludwig B, Ricci F. Matrix factorization techniques for 
context aware recommendation [Cl]// Proc of ACM Conference on 


Recommender Systems. 2011. 


